import pandas as pd
import re

# 读取Excel文件
df = pd.read_csv('C:\\Users\\govnet\\Desktop\\processed_file123.csv')

def convert_chinese_date(date_str):
    if pd.isna(date_str):  # 处理缺失值
        return None
    # 使用正则表达式提取日期中的年、月、日
    match = re.match(r"(\d{4})年(\d{1,2})月(\d{1,2})日", str(date_str))
    if match:
        year, month, day = match.groups()
        # 转换成标准日期格式 yyyy-mm-dd
        return f"{year}-{int(month):02d}-{int(day):02d}"
    return None

# 假设你的日期列是 'release_date' 和 'launch_date'
df['release_date'] = df['release_date'].apply(convert_chinese_date)
df['launch_date'] = df['launch_date'].apply(convert_chinese_date)

# 保存回原文件
df.to_csv('your_file_modified.csv', index=False)

print("日期格式转换完成并保存为新的文件")
